জেসুপ (JSoup) একটি Java লাইব্রেরি হিসেবে কাজ করে, তাই প্রথমে এটি ব্যবহার করতে আপনাকে একটি Java প্রজেক্ট তৈরি করতে হবে এবং JSoup লাইব্রেরি আপনার প্রজেক্টে যোগ করতে হবে। নিচে প্রথম JSoup প্রজেক্ট তৈরি করার ধাপগুলো দেওয়া হলো।
JSoup লাইব্রেরি ইনস্টল করা
প্রথমে JSoup লাইব্রেরি ডাউনলোড করতে হবে। যদি আপনি Maven বা Gradle ব্যবহার করেন, তবে আপনি আপনার প্রজেক্টে dependency হিসেবে JSoup যোগ করতে পারেন।
Maven ব্যবহার করে JSoup ইনস্টল করা
Maven ব্যবহার করলে আপনাকে pom.xml ফাইলে JSoup এর dependency যুক্ত করতে হবে:
<dependency>
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.15.3</version> <!-- সর্বশেষ ভার্সনটি ব্যবহার করুন -->
</dependency>
Gradle ব্যবহার করে JSoup ইনস্টল করা
Gradle ব্যবহারকারীদের build.gradle ফাইলে এই dependency যুক্ত করতে হবে:
dependencies {
implementation 'org.jsoup:jsoup:1.15.3' // সর্বশেষ ভার্সনটি ব্যবহার করুন
}
এছাড়া আপনি JSoup এর Jar ফাইল ডাউনলোড করে নিজে থেকে ইম্পোর্টও করতে পারেন। JSoup Official Website থেকে Jar ফাইল ডাউনলোড করতে পারবেন।
প্রথম JSoup প্রজেক্ট তৈরি করা
এখন JSoup লাইব্রেরি ইনস্টল করার পর, আপনি প্রথম JSoup প্রজেক্ট তৈরি করতে পারেন। নিচে একটি সাধারণ উদাহরণ দেওয়া হলো যেখানে JSoup ব্যবহার করে HTML ডকুমেন্ট পার্স করা হয়েছে।
উদাহরণ কোড: HTML পার্সিং এবং ডেটা এক্সট্র্যাক্ট করা
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
public class JsoupProject {
public static void main(String[] args) throws Exception {
// HTML ডকুমেন্ট স্ট্রিং
String html = "<html><head><title>My First JSoup Project</title></head><body><h1>Welcome to JSoup!</h1><p>This is a simple HTML page.</p></body></html>";
// HTML ডকুমেন্ট পার্স করা
Document doc = Jsoup.parse(html);
// ডকুমেন্টের টাইটেল এক্সট্র্যাক্ট করা
String title = doc.title();
System.out.println("Title: " + title);
// h1 ট্যাগের টেক্সট এক্সট্র্যাক্ট করা
Element heading = doc.select("h1").first();
System.out.println("Heading: " + heading.text());
// প্যারাগ্রাফের টেক্সট এক্সট্র্যাক্ট করা
Element paragraph = doc.select("p").first();
System.out.println("Paragraph: " + paragraph.text());
}
}
কোডের ব্যাখ্যা:
- প্রথমে
Jsoup.parse()মেথড দিয়ে HTML ডকুমেন্ট পার্স করা হয়। - তারপর
doc.title()মেথড দিয়ে HTML ডকুমেন্টের শিরোনাম (title) এক্সট্র্যাক্ট করা হয়। doc.select()মেথড দিয়ে HTML ডকুমেন্টের বিভিন্ন উপাদান, যেমনh1এবংpট্যাগ থেকে ডেটা এক্সট্র্যাক্ট করা হয়।
এটি আপনার প্রথম JSoup প্রজেক্ট হতে পারে যা HTML ডকুমেন্ট থেকে তথ্য সংগ্রহ এবং প্রক্রিয়া করতে সক্ষম।
সারাংশ
আপনার প্রথম JSoup প্রজেক্ট তৈরি করতে প্রথমে JSoup লাইব্রেরি আপনার প্রজেক্টে যুক্ত করতে হবে, তারপর HTML ডকুমেন্ট পার্সিং এবং বিভিন্ন ট্যাগ থেকে তথ্য এক্সট্র্যাক্ট করার জন্য Java কোড লিখতে হবে। JSoup এর সাহায্যে HTML থেকে ডাটা এক্সট্র্যাক্ট করা খুবই সহজ এবং কার্যকরী।
Read more